home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Internet Tools 1995 April / Internet Tools.iso / infoserv / www / cern / doc / www-talk.archive.Z / www-talk.archive / text0423.txt < prev    next >
Encoding:
Text File  |  1992-11-30  |  3.0 KB  |  98 lines

  1.  
  2. I just uploaded
  3.  
  4. html_spec-0.3.tar.Z
  5.  
  6. to info.cern.ch in pub/incoming.
  7.  
  8. It's hypertext including
  9.  
  10. * MarkUp.html -- the root node
  11. * Text.html -- an introduction to SGML syntax
  12. * html.dtd -- the spec expressed in HTML
  13. * several example files that form a validation suite
  14. * libHTML.tar -- some code that implements the low-level
  15.         SGML reading state machine (with a test driver)
  16.  
  17. Tim: please link this into the web somehow.
  18.  
  19. Implementors: please grab the whole thing and validate
  20. your implementation against it.
  21.  
  22. Tony: I've got some patches for the MidasWWW browser.
  23. I'm not quite done cleaning them up.
  24.  
  25. Linemode fans: I haven't started messing with linemode
  26. yet.
  27.  
  28. Issues Closed Pending Review:
  29.  
  30. Long Names
  31.  
  32. I included an SGML declaration that increases NAMELEN to 34,
  33. and LITLEN to 1024. I got these numbers from the DocBook DTD.
  34.  
  35.  
  36. SGML IDs for Anchor Names
  37.  
  38. The NAME attribute of the A element is an ID. It must start
  39. with a name, and it must be unique among all the IDs in
  40. the document. [Note that there is no way to validate the #anchor
  41. part of the HREF attribute. I'm working on that...]
  42.  
  43.  
  44. Multimedia Links
  45.  
  46. I included a content-type attribute for links so that you can tell the
  47. browser what type of data you're pointing to, and it can decide what to
  48. do with it (at a minimum, use this attribute and pass the data to
  49. metamail). I added a content-description attribute in case you want the
  50. reader to be able to get some information about the data without
  51. transfering it, but now I'm not sure it's a good idea. The description
  52. should go in the content of the A element.
  53.  
  54.  
  55. Formatted Text with Anchors
  56.  
  57. I took the semantics of the PRE tag, added the WIDTH attribute, and
  58. called it TYPEWRITER (inspired by the nroff man page). It's parsed like
  59. most other elements, but displayed like XMP or LISTING or PLAINTEXT.
  60.  
  61. Newline handling isn't a parsing issue -- it's a display issue. I think
  62. it will be more straightforward to define newlines in TYPEWRITER
  63. content to be significant. That way, once the data is parsed, XMP
  64. and TYPEWRITER work just the same. Lines may get real long. That's
  65. life. If you want to mail it, use MIME or uuencode or something.
  66.  
  67. XMP and LISTING elements are CDATA: they have no markup in their
  68. content. There's no way to put </TITLE> inside an XMP element.
  69.  
  70. PLAINTEXT is an empty element that signals the end of a text/html
  71. entity and begins a text/plain entity.
  72.  
  73.  
  74. Ordered Lists
  75.  
  76. I included them in the DTD. Any objections?
  77.  
  78.  
  79. ISO Latin 1 Characters:
  80.  
  81. I included a reference to "ISO 8879:1986//ENTITIES Added Latin 1//EN"
  82. in the HTML DTD. This defines entities for all ISO latin 1 characters.
  83. Clients will need a table of the names and local translations.
  84.  
  85.  
  86. Open Issues:
  87.  
  88. Highlighting: Who's tags should we use? LaTeX seems to be an adequate
  89. markup system for lots of folks. Its tags are
  90.     em | it | bf | sf | sl | tt
  91.  
  92. The DocBook folks use only semantic tags: they don't have bold or italic
  93. tags. The MIME richtext stuff has only typographic tags: no <emphasis>
  94. or <booktitle> or any such thing.
  95.  
  96. Dan
  97.  
  98.